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摘要 : 在 网 络 化 、 信 息 化 逐渐 改变 人 们 学 习 、 认 知 和 生活 的 背景 下 ， 本 文 检索 并 分 析 了 与 Flora 研究 相关 
的 DNA 条 形 码 、 生 物 多 样 性 信息 库 、 基 因 测 序 技术 、 移 动 鉴 定 设 备 等 研究 论文 和 情报 ， 取 得 下 列 结果 : 
(1) 植物 DNA 条 形 码 的 研究 对 象 以 及 研究 领域 在 不 断 延伸 和 扩展 ， 但 寻找 高 分 辨 率 的 DNA 条 码 和 组 合 片 
段 仍 是 研究 热点 ， 相 关 的 植物 分 类 学 、 系 统 发 育 与 演化 、 生 态 学 、 植 物 多 样 性 等 研究 也 在 快速 发 展 ，(2) 
生物 多 样 性 信息 数据 库 建设 爆发 式 增长 ， 为 Flora 的 知识 积累 和 扩展 葛 定 了 基础 ，(3) 第 三 代 DNA 测序 
技术 的 发 展 ， 快 速 测序 设备 的 小 型 化 将 成 为 可 能 ; (4) 物种 认 知 和 识别 的 初级 移动 设备 已 经 出 现 ; (5) 信 
息 技 术 与 植物 科学 等 研究 的 结合 ， 促 进 跨 领域 的 研究 合作 和 产品 开发 。 本 文 讨论 了 iFlora 研究 计划 ， 表 明 
其 是 未 来 植物 多 样 性 研究 的 发 展 趋势 。 
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Trends of iFlora by Literature and Information Analysis 


YANG Ya', WANG Yu-Hua'™ , DU Ning, WANG Chun-Ming? 
(1 Science and Technology Information Center, Kunming Institute of Botany, Chinese Academy of Sciences , 
Kunming 650201, China; 2 Chengdu Branch of National Science Library , 
Chinese Academy of Sciences, Chengdu 610041, China) 


Abstract: Advances in networking and information technology are gradually changing our ways of learning, cognition 
and living. This paper employed the methods of bibliometry and retrieval to analyze research papers and information 
about DNA barcoding, biodiversity database, DNA sequencing technology and mobile identification devices which 
are related to iFlora research. The results indicate that; (1) The research field of plant DNA barcoding is expan- 
ding, but the exploration of a high-resolution DNA barcode and combinations of barcodes is still on the top of the a- 
genda. And integrated studies of plant taxonomy, plant systematics and evolution, ecology, plant diversity etc. are 
constantly developing; (2) The explosive growth of biodiversity information databases provides the foundation for the 
accumulation and expansion of knowledge about iFlora; (3) The third-generation sequencing technology has emerged 
and rapidly developing. The miniaturization of sequencing equipment will soon become feasible; (4) Only a few ex- 
perimental devices which can assist with the identification of plant species have appeared so far; (5) A cyberin- 
frastructure collaborative for the plant sciences promote interdisciplinary research and product development. Finally, 
the paper concludes with a discussion of the iFlora research plan and shows that it is an inevitable trend in future 
studies on plant diversity. 


Key words: Bibliometry; Plant DNA barcoding; Database; iFlora; Research trends 
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iFlora 是 为 植物 学 家 、 政 府 部 门 、 行 业 和 公 
众 提供 的 便捷 、 准 确 识 别 植物 的 新 一 代 “ 智 能 
植物 志 ”( 李 德 铁 等 , 2012) 。 它 涉及 多 个 学 科 复 
杂 的 研究 问题 和 运行 环境 ， 需 要 跨 学 科 情 报 资料 
的 整合 ， 才 能 够 更 好 地 体现 相关 研究 的 最 新 成 
有 果 。 本 文 综合 运用 文献 情报 分 析 的 手段 和 方法 ， 
通过 选 定 统计 源 ， 对 与 Flora 研究 相关 的 DNA 
条 形 码 、 生 物 多 样 性 信息 库 、 基 因 测 序 技术 、 移 
动 鉴 定 设备 等 研究 论文 和 情报 信息 进行 了 统计 分 
析 和 追踪 ， 以 期 为 iFlora 的 研制 提供 相关 资料 。 








1 数据 源 与 研究 方法 

本 文 检 索 了 多 个 国内 外 数据 库 和 相关 研究 机 
构 、 研 究 平台 网 站 。 文 献 信 息 主要 来 自 于 Science 
Citation Index Expanded 数据 库 、Conference Pro- 
ceedings Citation Index-Science 数据 库 、Current 
Chemical Reactions 数据 库 、China National Knowl- 
edge Infrastructure 数据 库 以 及 相关 的 iPlant, GBIF, 
iBOL、eFlora 等 研究 机 构 和 研究 平台 网 站 。 检 索 
时 间 为 各 数据 库 的 起 始 时 间 到 2012 年 9 月 10 
日 ， 并 利用 WOS 引文 分 析 工 具 、Citespace 等 文 
献 情报 分 析 的 手段 和 方法 对 相关 数据 进行 了 文献 
数据 挖掘 和 可 视 化 分 析 。 





2 iFlora 相关 研究 进展 
2.1 植物 DNA 条 码 
2.1.1 研究 领域 概况 “文献 总 量 反映 了 一 定时 
期 内 科学 研究 活动 的 绝对 产 出 ， 是 衡量 科研 活动 
的 一 个 重要 指示 因子 (Moed, 2002) 。 通 过 Sci- 
ence Citation Index Expanded 数据 库 ， 检 索 到 整 
个 DNA 条 形 码 研究 领域 发 表 了 2415 篇 文献 CAR 
止 2012 年 9 月 10 H), 其 中 植物 DNA 条形码 相 
关 文 献 有 490 篇 。 以 ISI 分 类 来 看 ， 相 对 植物 DNA 
条 形 码 ， 动 物 DNA 条 形 码 的 研究 开始 更 早 ， 但 
植物 DNA 条 形 码 研究 从 2008 年 起 增 速 加 快 ， 成 
为 研究 热点 之 一 (EI). 

目前 共有 64 个 国家 涉 入 植物 DNA 条 形 码 人 研 
究 领 域 ， 其 中 美国 、 加 拿 大 等 国家 相关 研究 开始 
较 早 ， 中 国 的 相关 研究 论文 从 2008 年 开始 出 现 ， 
但 增 速 较 快 。 目 前 发 表 文章 较 多 的 国家 依次 是 美 
E] (135 篇 ) "PES (85 篇 ) 、 加 拿 大 (61 篇 )、 
法 国 (49 篇 ) 。 参 与 研究 的 机 构 有 210 个 ， 中 国 














科学 院 虽 然 进 入 该 领域 时 间 较 晚 ， 但 论文 总 量 日 
前 排 在 世界 第 一 位 ， 其 次 是 加 拿 大 圭 尔 夫 大 学 、 
中 国医 学 科学 院 药 物 研 究 院 、 美 国史 密 森 研究 
院 。 从 研究 论文 影响 力 来 看 ， 被 引用 次 数 最 高 的 
文章 是 美国 史 密 森 研究 院 John Kress 教授 推荐 的 
有 花 植物 DNA 条 形 码 的 文章 (Kress ^5, 2005) 。 
依据 篇 均 被 引用 次 数 ， 美 国 (22.33), WEK 
(28.78) 和 新 西 兰 (34. 61) 的 研究 论文 受 关注 
程度 较 高 ， 中 国 的 研究 论文 因为 发 表 较 晚 ， 篇 均 
被 引用 次 数 为 5.65， 相 对 较 低 。 在 该 领域 影响 
力 较 高 的 机 构 是 加 拿 大 圭 尔 夫 大 学 (45.19) 和 
美国 史 密 条 研究 院 (32. 16)。 

DNA 条 形 码 研究 吸引 了 超过 一 千 名 科研 人 
员 的 参与 ， 研 究 论文 产 出 最 多 的 作者 是 中 国医 
学 科学 院 药物 研究 院 陈 士 林 (27 篇 ， 篇 均 被 
引用 次 数 为 10. 23 ) 。 研 究 影响 力 最 高 的 是 美国 
史 密 森 研究 院 John Kress (篇 均 被 引用 次 数 达 
78.15) 和 加 拿 大 丰 尔 夫 大 学 的 Paul Hebert (篇 
均 被 引用 次 数 达 73. 62 ) 。 刊 载 植物 DNA 条 形 码 
相关 研究 最 多 的 期 刊 是 《PLoS ONE) 51 篇 、 
《MOLECULAR ECOLOGY RESOURCES》38 篇 、 
《JOURNAL OF SYSTEMATICS AND EVOLUTION 》 
20 篇 和 《PLANTA MEDICA 》19 篇 。 
2.1.2 研究 主题 分 析 利用 Citespace 分 析 相 关 
领域 发 表 论文 ， 得 到 植物 DNA 研究 领域 的 高 频 关 
键 词 ( 表 1， 图 2)， 可 以 看 出 植物 DNA 条 形 码 的 
研究 对 象 以 及 研究 领域 一 直 在 不 断 延伸 和 扩展 。 











表 1 植物 DNA 条 形 码 研究 关键 词 变 化 统计 表 
Table ] Keywords change statistics of plant 


DNA barcoding study 


部 分 高 频 关键 词 〈 按 出 现 频率 排序 ) 








研究 内 容 植物 类 条 形 码 类 
identification land plants rbcL 
taxonomy flowering plants matK 
sequences fungi ITS 
phylogeny Fabaceae tmH-psbA 
evolution tropical forests psbA-trnH 
diversity ginseng trnL-F 
molecular systematics ferns rpoCl 
biogeography angiosperms rbcL 
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图 1 植物 DNA 条 形 码 主要 国家 和 机 构 研究 情况 


Fig.1 Major countries and institutions in plant DNA barcoding study 
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Fig.2 Index word clustering map of plant DNA barcoding study 
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在 DNA 条形码 研究 方面 ，2009 年 CBOL fH 
物 工作 组 建议 将 rbcL 和 matK 作为 陆地 植物 通用 
的 条 形 码 ( CBOL Plant Working Group, 2009), 
叶绿体 基因 间隔 区 psbA-trnH 和 核 基 因 片 段 ITS 
也 被 提议 可 以 作为 陆 生 植 物 的 标准 DNA 条 形 码 
核心 片段 (Kress 等 ，2005; Hollingsworth 等 ， 
2011), ， 但 寻找 高 分 辩 率 的 DNA 条 码 和 组 合 片 段 
仍 是 植物 条 形 码 研究 的 热点 : (1) 主要 的 单 片 段 
研究 : rbcL 被 大 部 分 学 者 作为 研究 对 象 (129 
篇 ) ， 其 次 是 matK (101 篇 ) ITS (97 篇 ) 和 
trnH-psbA (79 篇 ) 。 近 年 来 ， 大 多 数 研究 者 都 在 
不 同 物种 中 验证 4 个 被 广泛 建议 的 DNA 条 形 码 
的 有 效 性 。rbcL 和 matK 作为 核心 条 形 码 ， 受 到 
的 关注 度 最 高 。rbcL 具有 通用 性 高 、 易 扩 增 、 易 
对 比 的 特点 ， 可 以 区 分 不 同属 物种 ， 但 在 种 的 区 
分 上 效果 不 理想 (Kress 和 Erickson, 2007; Faze- 
kas 等 ，2008; Bafeel 等 ，2012 ) Kress 等 (2007) 
采用 matk 对 48 属 96 种 植物 的 成 功 扩 增 率 仅 为 
39.3% ; Fazekas 等 (2008) 利用 该 片段 对 92 种 
植物 的 正确 识别 率 仅 达到 56% ， 因 此 mark 通用 
性 引物 的 设计 和 效果 验证 将 是 下 一 步 工作 重点 
( 唐 建 阳 等 ,2009 ) 。 近 年 来 ，maiK 通用 引物 在 
被 子 植物 中 验证 了 具有 很 好 的 适用 性 (Yu 等 ， 
2011)， 目 前 matK 也 常用 在 遗传 关系 分 析 
(Wang 等 ,2012) 和 系统 发 育 研究 方面 (Liu 
等 , 2012; Crawley 和 Hilu, 2012), ITS 作为 DNA 
条 形 码 鉴定 物种 的 潜力 得 到 了 一 些 人 研究 者 的 认 
nf, ITS2 被 提出 可 作为 通用 DNA 条 形 码 来 鉴定 
植物 和 动物 (Chen 等 ,2010; Yao 等 ，2010 ) ， 
近年 来 ， 针 对 其 在 药 用 植物 方面 的 探讨 相对 较 
多 。2012 年 的 文献 中 ，ITS2 在 鉴定 展 形 科 药 用 
植物 (Han 等 , 2012) 、 五 加 科 (Liu 等 , 2012) 
等 药 用 植物 上 有 很 好 的 表现 。 根 据 对 主要 来 自 中 
国 的 种 子 植物 的 4 个 DNA 候选 条 形 码 片段 的 综 
合 分 析 ， 中 国 植物 条 形 码 人 研究 团队 (China Plant 
BOL Group) 建议 将 ITS 作为 种 子 植物 的 核心 
DNA 条 形 码 (Li 等 , 2011)。trnH-psbA 间隔 区 
是 叶绿体 基因 进化 速率 较 快 的 片段 之 一 ， 并 且 易 
于 设计 引物 (Shaw 等 , 2005 ) ， 鉴 于 该 片段 在 扩 
增 成 功率 和 物种 识别 率 上 的 出 色 表 现 ， 建 议 
trnH-psbA 应 作为 条 形 码 片段 组 合 中 重要 的 非 编 
人 码 区 片段 之 一 ( Kress 和 Erickson, 2007; Fazekas 








等 , 2008; Chen 等 , 2010) 。 区 分 近 缘 及 近期 分 
化 物种 是 DNA 条 形 码 研究 的 重要 挑战 ， 仅 2012 
年 就 有 37 篇 文献 涉及 trnH-psbA 的 讨论 。(2) 片 
段 组 合 情 况 : 随 研 究 的 不 断 深入 ,研究 人 员 发 现 
单一 片段 DNA 条 形 码 存在 一 定 的 局 限 性 ， 提 出 
需要 多 片段 组 合 。Kress 等 (2007) 提出 使 用 
rbcL- trnH-psbA 对 陆 生 植 物 进行 识别 和 鉴定 ; 
Chase (2007) 提出 了 rpoCl-rpoB  matK 或 
rpoCl + matK + trnH-psbA 的 组 合 ; Lahaye 等 
(2008) 和 Newmaster 等 (2008) #94844 T matK 
+trnH-psbA 的 组 合 ; 而 Hollingsworth 等 (2009 ) 
通过 对 7 个 候选 DNA 条 形 码 的 评估 分 析 认 为 ， 
三 个 DNA 片段 组 合 ( rbcL + trnH-psb A + matK , 
rpoCl +rbcL+irnH-psbA 和 rpoCl+rbcL+matK) J 
能 成 功 鉴 定 57% ~ 60% 的 物种 ， 建 议 rbcL, 
rpoCl, matK 和 trnH-psbA 间 的 一 些 组 合 可 作为 
陆 生 植物 条 形 码 的 解决 方案 。 通 过 综合 评价 分 
析 ，CBOL 植物 工作 组 建议 将 rbcL+matK 组 合作 
为 陆地 植物 的 核心 条 形 码 (CBOL Plant Working 
Group, 2009) , rbcL, matK 和 trnH-psbA 三 个 条 
形 码 片段 单独 用 于 识别 热带 雨林 木 本 植物 的 准确 
率 分 别 为 62% 、55% 和 74% ; 如 果 使 用 rbcL- 
matK 两 个 片段 组 合 ， 准确 率 约 为 76% ; 如 果 使 
用 rbcL+matK+trnH-psb A 三 个 片段 组 合 ， 准 确 率 
能 提高 至 84% (Kress 等 , 2009) 。 

在 研究 主题 进展 方面 ， 研 究 较 多 的 是 陆地 植 
物 、 开 花 植物 和 药 用 植物 。2011 年 和 2012 年 出 
现 最 多 的 植物 类 关键 词 是 豆 科 植物 ERE 
和 药 用 植物 ，2012 年 还 出 现 了 对 无 开花 种 子 植 
物 的 研究 (Pang 等 , 2012) ， 验 证 了 用 ITS 可 以 
有 效 区 分 无 开花 种 子 植物 。 药 用 植物 的 鉴定 成 为 
近年 来 相关 研究 的 热点 (51 篇 )， 以 中 国 研究 最 
多 (29 篇 ) 。 在 药 用 植物 领域 ， 出 现 次 数 最 多 关 
键 词 的 是 ITS2、matK 和 trnH-psbA , ITS2 被 推荐 
作为 药 用 植物 的 通用 DNA. 条 形 码 (Chen 等 ， 
2010)。 

物种 识别 和 鉴定 是 植物 DNA. 条 形 码 研 究 的 
重要 内 容 ， 关 键 词 “鉴定 (identification)” 在 文 
献 中 出 现 的 频率 最 高 (120 次 ) 。 除 寻找 高 分 辩 
率 的 DNA 条 码 和 组 合 片段 外 ， 其 他 出 现 频率 较 
高 的 关键 词 是 : (1) 系统 发 育 人 研究 。 如 结合 群落 
生态 学 进行 植物 群落 系统 发 育 研 究 (Kress 等 ， 
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2009; Gonzalez 等 , 2010) ; (2) 植物 分 类 学 。 如 
外 来 和 人 侵 物 种 和 濒危 物种 鉴定 (Dick 和 Kress, 
2009) ， 发 现 新 种 和 疑难 物种 ( Pennisi, 2007; 


形 码 数 据 平台 相继 建立 。 国 际 生命 条 形 码 计划 
(iBOL, International Barcode of Life) 由 加 拿 大 科 
学 家 Paul Hebert 等 发 起 ， 于 2010 年 正式 启动 ， 














Lahaye 等 , 2008), ， 如 2012 年 一 种 来 自 于 安第斯 


目标 是 5 年 获得 至 少 50 万 个 物种 的 DNA 条 形 码 








山 云雾 森林 的 灌木 于 4 月 被 正式 分 类 命名 ， 这 一 
发 现 开创 了 DNA 条 形 码 定义 新 植物 种 类 的 先河 
( Filipowicz am 2012) ; (3) 植物 多 样 性 研究 。 如 
利用 DNA 条 形 作为 植物 类 群 物种 多 样 性 识别 和 
检测 工具 ( Armenise 等 , 2012) iit DNA 条 形 
码 研 究 植物 根系 群落 多 样 性 ( Kesanakurti 等 ， 
2011 ) ， 进 行 某 一 地 区 植被 调查 (De Mattia 等 ， 
2012) 等 。 同 时 ，DNA 条 形 码 研究 的 应 用 已 扩 
展 到 日 常生 活 中 ， 加 拿 大 在 尔 夫 大 学 使 用 DNA 
条 形 码 来 验证 90 多 个 广泛 使 用 的 植物 和 动物 的 
天 然 保健 品 成 分 ， 包 括 升 厂 、 绿 茶 和 圣 约 翰 草 等 
(Lauren 等 , 2012), 

2.2 生物 多 样 性 信息 平台 

伴随 着 生物 信息 学 及 计算 机 科学 的 发 展 ， 生 
物 多 样 性 信息 数据 库 建 设 爆 发 式 增长 。 根 据 生物 
多 样 性 信息 学 标准 (TDWG) 网 站 (http://www. 
tdwg. org/biodiv-projeets/) 的 统计 ， 目 前 有 超过 
679 个 生物 多 样 性 信息 学 研究 项 目 ，62 个 生物 多 
样 性 信息 网 络 数据 库 RE 2012 年 9 月 10 日 )。 
生物 多 样 性 数据 和 信息 服务 的 内 容 不 断 扩 展 ， 已 
经 覆盖 了 分 类 学 、 生 态 学 、 分 子 生物 学 、 生 物 地 
理学 和 生物 多 样 性 等 相关 研究 领域 。 

现 有 生物 多 样 性 信息 平台 类 型 多 样 ， 包 括 
(1) 物种 信息 数据 库 ， 如 物种 2000、 中 国 植物 
物种 信息 数据 库 (DCP) 等 ; (2) 标本 数据 库 ， 
如 中 国 数字 植物 标本 馆 ; (3) 图 像 数据 库 ， 如 牛 
津 大 学 的 The Virtual Field Herbarium Ji H ; (4) 
文献 信息 数据 库 ， 如 生物 多 样 性 遗产 图 书馆 
BHL 等 。 由 于 生物 多 样 性 工作 在 国际 间 的 交流 
和 合作 增多 ， 综 合 型 和 跨 学 科 的 国际 生物 多 样 性 
平台 的 建设 开始 成 为 主流 ， 全 球 生物 多 样 性 信息 
网 络 (GBIF) 通过 多 样 性 原始 数据 的 共享 ， 将 
目前 世界 上 现存 的 生物 多 样 性 数据 库 及 信息 系 
统 整合 ， 形 成 一 个 面向 全 世界 用 户 的 关于 全 球 生 
物 多 样 性 的 综合 性 信息 服务 系统 (http://www. 
gbif. org/) 。 

此 外 ，DNA 条 形 码 的 出 现 及 发 展 ， 丰 富 了 
生物 多 样 性 信息 学 的 内 容 ， 大 量 的 生物 DNA 条 























标准 序列 ， 其 中 包括 10 万 种 陆 生 植物 ， 并 建立 
通用 的 实验 标准 和 数据 平台 。iBOL 的 主要 科学 
成 果 是 全 球 条 形 码 (BOLD) 系统 (www. bold- 
systems. org) ，2012 年 iBOL 正式 成 为 GBIF 的 参 
与 者 。 生 命 条 形 码 咨询 委员 会 (Consortium Bar- 
coding of Life, CBOL) 已 启动 了 一 系列 的 DNA 条 
形 码 计划 ， 包 括 : 鸟 类 ABBI, f% FISH-BOL、 
海洋 生物 MarBOL、 实 晶 TBI[、 蚊 子 MBI, SEE 
Bee-BOL 等 ， 并 建立 了 国际 植物 条 形 码 工作 组 
(CBOL Plant Working Group ) ， 目 前 已 进入 大 规 
模 的 标本 收集 、 测 序 、 物 种 鉴定 等 阶段 。 

除了 这 些 大 型 数据 平台 ,各 国 科学 家 也 在 探 
索 建立 自己 的 DNA 条 形 码 数 据 库 。 例 如 ， 香 港 
大 学 建立 药材 DNA 数据 库 (MMDBD), 3 T. 
作 提 供 了 一 个 整合 的 药材 DNA 条 码 资料 库 和 生 
物 信 息 学 工具 ， 可 以 进行 数据 存储 、 分 析 和 促进 
药材 鉴定 交流 (Lou 等 , 2010)。 中 国 西南 野生 
生物 种 质 资 源 库 建立 了 “中 国 重要 生物 类 和 群 
DNA 条 形 码 数据 库 ”( http ://www. pbl. esdb. en) o 
韩国 基于 亚洲 生物 多 样 性 建立 了 BioBarcode 数据 
FE (Lim 等 , 2009) BioBarcode 数据 库 可 以 免费 
为 亚洲 DNA 条 码 技术 研究 人 员 提 供 亚洲 生物 多 
样 性 资源 。 韩 国生 命 数据 库 (KBOL, http://ko- 
reabarcode. org) 是 一 个 基于 Web 的 数据 库 系 统 ， 
用 于 编译 大 量 的 DNA 条 形 码 数据 和 鉴定 未 知 的 
生物 标本 ， 用 户 不 仅 可 以 获取 DNA 条 形 码 和 生 
物 信息 学 数据 ， 也 可 以 厌 此 平台 开展 资源 保护 工 
作 ， 包 括 环境 管理 、 监 测 和 检测 有 机 体 指标 。 

在 数据 库 开 发 方面 ， 加 拿 大 圭 尔 夫 大 学 在 
DNA 条 码 的 研究 中 一 直 处 于 世界 领先 水 平 ， 
2009 年 其 在 DNA 条 形 码 数 据 库 的 基础 上 开发 了 
“The DNA Barcode Linker” 工 具 ， 可 以 用 Google 
的 方法 来 检索 条 形 码 ， 它 提供 了 一 个 在 网 络 上 搜 
索 序列 强大 和 有 效 的 解决 方案 ， 以 及 更 快捷 地 访 
问 DNA 条 码 大 型 序列 库 的 服务 (Hajibabaei 等 ， 
2009) 。 

2.3 DNA 测序 技术 
高 通 量 、 低 成 本 的 DNA 测序 技术 成 为 后 基 
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因 组 时 代 的 挑战 之 一 。 经 过 了 第 一 代 的 Sanger 
测序 时 代 ， 第 二 代 以 高 通 量 测序 为 主 ， 第 二 代 测 
序 技术 与 第 一 代 Sanger 测序 法 的 原理 都 是 基于 
边 合 成 边 测序 的 思想 ， 但 第 二 代 的 高 通 量 测 序 技 
术 速 度 快 、 成 本 低 ， 使 其 在 植物 全 基因 组 测序 、 
植物 转录 组 测序 、 小 分 子 RNA 研究 等 生命 科学 
研究 领域 迅速 得 到 广泛 应 用 。 目 前 ， 第 三 代 测 序 
技术 已 经 出 现 ， 结 合 了 单 分 子 测序 并 继承 了 高 通 
量 测序 的 优点 ， 其 中 正在 研发 的 纳米 孔 单 分 子 技 
术 则 更 是 在 原理 上 做 出 本 质变 革 ( 孙 海 汐 和 王 
FAS, 2009) 。 对 于 纳米 孔 测 序 技术 而 言 ， 最 大 
挑战 之 一 是 ，DNA 链 通 过 纳米 孔 的 速度 太 快 ， 
以 致 来 不 及 对 碱 基 进 行 检 测 ， 因 此 目前 的 研究 一 
方面 尝试 减缓 DNA 通过 的 速度 ， 另 一 方面 构建 
更 快 的 检测 设备 。2010 年 美国 华盛顿 大 学 物理 
学 家 领导 的 研究 小 组 结合 生物 和 纳米 技术 ， 在 纳 
米 孔 内 对 DNA 进行 快速 测序 ， 研 制 出 DNA 阅读 
器 。 这 种 纳米 微 孔 只 有 1 个 纳米 大 小 ， 仅 够 用 来 
测量 一 个 DNA 的 单 分 子 链 (Butler 等 , 2008; Der- 
rington 等 , 2010) 。 为 了 能 获得 可 行 的 、 易 于 操控 
的 测序 平台 ， 该 研究 小 组 提高 了 蛋白 纳米 孔 的 效 
用 ， 最 新 报道 了 第 三 代 DNA 测序 技术 新 机 制 ， 即 
纳米 孔 检 测 核酸 碱 基数 增加 至 20 ~ 30 个 ( Manrao 
等 , 2012) , ， 这 使 纳米 孔 测序 的 研究 更 进一步 。 
纳米 级 别 的 孔径 保证 了 检测 具有 和 良好 的 持续 性 ， 
所 以 测序 的 准确 度 非常 高 。 使 用 纳米 孔 测 序 法 进 
行 检测 ， 使 得 便宜 、 快 速 地 进行 DNA 测序 成 为 
可 能 。 
2.4 移动 识别 设备 

在 早期 的 DNA 条 形 码 研究 中 开始 出 现 了 便 
携 式 装 置 设 想 (Janzen, 2004), 但 目前 还 没有 
文献 报道 成 功 实现 DNA 条 形 码 的 移动 识别 设备 。 
加 拿 大 圭 尔 夫 大 学 一 直 是 手持 设备 构想 的 有 力 推 
动 者 ， 并 致力 于 手持 识别 设备 的 开发 ， 在 发 表 的 
很 多 文章 中 都 探讨 了 手持 识别 设备 开发 的 实现 ， 
如 提出 组 织 片段 插入 到 扫描 仪 后 ， 用 户 会 收 到 一 
个 即时 的 现场 鉴定 动物 或 植物 的 设想 (Singer 和 
Hajibabaei, 2009) ， 考 虑 简化 分 析 链 以 助 于 发 展 
手持 式 条 形 码 设备 (Ivanova, 2009) %, EKR 
大 学 主导 的 BOL 项 目 中 一 个 主要 的 研究 核心 就 
是 联合 相关 信息 技术 专家 尝试 研发 出 便携 式 的 
DNA 条 形 码 移动 识别 设备 ， 可 以 直接 链接 到 























BOLD 数据 库 。 

2012 年 美国 加 州 的 沿海 海洋 生物 实验 室 发 布 
了 第 一 款 iPhone 应 用 程序 “DNA 条 形 码 助 理 ” 
(http://www.dnabarcodingassistant. org/) o “DNA 条 
形 码 助 理 ” 是 一 个 新 的 移动 技术 应 用 程序 ， 提 供 
了 一 个 直观 的 界面 ， 可 从 国际 生命 条 码 (iBOLD) 
项 目 获取 元 数据 。 通 过 唯一 标识 符 和 编译 记录 ， 
使 用 户 能 够 获取 分 类 标识 、 数 人 友 影像、 地理 空间 
数据 以 及 物种 详细 信息 。 标 本 记录 可 以 导出 到 
iPhone 或 很 容易 导入 到 Excel 电子 表格 。 

除 DNA 条 形 码 外 ， 图 像 识 别 也 是 移动 识别 
设备 的 关键 技术 热点 。 美 国史 密 森 研究 院 、 哥 伦 
比 亚 大 学 和 马里 兰 大 学 开发 了 世界 上 第 一 个 植物 识 
别 的 移动 应 用 程序 一 Leafsnap ( Belhumeur, 2008) 。 
Leafsnap 通过 计算 机 视觉 图 像 技 术 将 叶片 图 像 与 
数据 库 进行 对 比 ， 用 户 可 以 快速 比较 与 提供 照片 
的 标本 是 否 属于 同一 物种 ， 并 由 此 建立 了 Leafs- 
nap 系统 ， 与 iPhone 等 相 结 合 ， 实 现 手持 设备 的 
应 用 。 虽 然 该 移动 设备 不 是 使 用 DNA 数据 ， 但 
是 通过 图 像 对 比 ， 得 到 结果 的 正确 率 也 达到 
80% 以 上 。DNA 数据 远程 获取 和 图 像 识 别 都 是 
对 移动 识别 设备 的 一 种 尝试 ， 对 于 真正 实现 移动 
识别 设备 来 说 ， 必 要 的 技术 还 有 待 开 发 ， 未 来 所 
面临 的 挑战 在 于 如 何 整 合 这 些 技 术 并 降低 成 本 。 
2.5 整合 性 研究 
2.5.1 基础 信息 数字 化 整合 利用 ”物种 及 其 地 
理 分 布 是 生物 多 样 性 基础 数据 。 植 物 志 作为 一 种 
记载 物种 信息 及 其 地 理 分 布 的 传统 载体 ， 随 着 网 
络 化 时 代 的 到 来 也 在 逐渐 发 生 转 变 。 最 先 受 到 网 
络 化 影响 的 就 是 电子 化 植物 志 的 出 现 。2006 年 
就 有 文章 报道 通过 Flora of China 计划 实现 了 
eFloras ( http://www. efloras. org/) 的 开发 ， 通 
过 访问 网 上 的 电子 植物 志 ， 用 户 可 以 在 线 浏览 植 
物 区 系 的 信息 ， 并 可 以 按 名 称 搜索 ,不 过 ,植物 
志 数 字 化 开始 的 时 间 远 比 文献 报道 早 得 多 。2012 
年 “国际 生物 多 样 性 公约 ”第 十 届 缔 约 国 大 会 
一 臻 通过 的 最 新 的 《全 球 植物 保护 战略 (2011 - 
2020)) (GSPC), ， 提 出 希望 全 地 界 植物 研究 机 构 
共同 合作 ， 力 争 在 2020 年 完成 “世界 全 部 已 知 
植物 的 在 线 植 物 志 ”(online flora of all known 
plants) 。 这 一 构想 将 植物 志 的 数字 化 和 整合 推 向 


一 个 新 高 峰 。 
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此 外 ， 很 多 网 站 已 经 开始 提供 物种 编目 信息 
的 数字 化 ， 比 较 早 期 的 是 印 园 索引 (Index Kew- 
ensis) 、 际 植物 学 名 索引 (International Plant 
Name Index, IPNI) 、 分 类 学 信息 系统 (Integrated 
Taxonomic Information System, ITIS) 等 。 其 中 最 
影响 力 的 是 物种 2000， 主 要 建立 了 一 个 包含 
全 球 主要 生物 类 群 的 物种 工作 名 录 ， 提 供 免 费 下 
载 和 使 用 。 全 球 生物 多 样 性 信息 学 组 织 GBIF 也 
发 起 了 全 球 分 类 名 称 架 构 (Global Name Archi- 
tecture, GNA) 项 目 ， 力 图 建立 一 个 多 层次 的 名 
称 数 据 体 系 ， 联 合 多 个 信息 源 ， 整 合 全 球 分 类 名 
称 信 息 ， 从 而 促进 生物 多 样 性 研究 和 利用 。 
2.5.2 跨 领 域 研究 计划 计算 机 技术 、 网 络 基 
础 设施 与 现代 植物 学 研究 的 结合 是 未 来 植物 科学 
的 发 展 趋势 。 目 前 在 这 方面 的 相关 计划 和 研究 数 
量 还 不 多 。2008 年 美国 国家 科学 基金 (NSF) 
资助 开发 的 探索 物种 起 源 的 iPlant 计划 ， 研 究 大 
型 网 络 基础 设施 与 植物 科学 研究 的 结合 ， 创 造 了 
一 个 大 型 的 网 络 协作 平台 。 该 项 目 是 基于 网 络 基 
础 设施 的 合作 ， 不 仅 是 对 纯粹 的 网 络 基础 设施 的 
利用 ,还 涉及 协同 研发 平台 的 构建 。 生 物 学 家 、 
计算 机 信息 科学 家 和 工程 师 通 过 这 个 平台 ， 利 用 
科学 计算 和 网 络 基 础 设施 共同 来 解决 生命 科学 上 
的 重大 问题 。 该 项 目 优先 的 目标 是 建设 “大 规 
模 ” 系 统 进化 树 ， 了 解 植物 物种 关系 、 基 因 家 
族 的 演化 ， 解 决 分 类 学 问题 等 。 目 前 已 取得 了 一 
些 重要 进展 ， 如 使 用 系统 进化 树 讨 论 几 个 大 的 被 
子 植物 类 群 的 多 样 性 (Smith, 2011) ; 同时 还 开 
A T “Discovery environment” 工 具 ， 集 成 了 现 
有 的 生物 信息 学 工具 ， 可 以 在 远程 高 性 能 计算 资 
源 上 无 颖 运行 。 其 中 “生命 之 树 (Tree of life)” 
可 视 化 工具 创新 了 系统 进化 树 的 展现 方式 ， 能 
帮助 科研 人 员 跟 踪 基 因 组 序列 ， 研 究 植物 迁移 、 
适应 气候 变化 的 方式 等 。 这 项 跨 领域 的 合作 汇集 
了 植物 学 、 生 物 信 息 党、 计算 科学 和 高 性 能 计 
算 的 优势 ， 极 大 地 促进 了 植物 学 研究 领域 的 创 
新 发 展 。 























3 结语 
综 上 所 述 ， 通 过 相关 分 析 表 明 : (1) 植物 
DNA 条 形 码 作为 iFlora 的 组 成 要 素 之 一 ， 其 研究 


对 象 以 及 研究 领域 在 不 断 延 伸 和 扩展 。 目 前 寻找 
高 鉴定 分 辩 率 的 DNA 条 码 和 组 合 片段 仍 是 研究 
热点 。 同 时 ， 国 际 上 的 研究 者 们 开始 将 选 定 的 条 
形 码 应 用 于 生命 科学 多 个 研究 领域 ,并 逐步 建立 
完整 的 条 形 码 数据 库 以 及 开发 各 种 应 用 工具 ; 
(2) 生物 多 样 性 信息 数据 库 建 设 爆发 式 增长 ， 综 
合 型 和 跨 学 科 的 国际 性 生物 多 样 性 平台 开始 出 
现 ， 大 量 的 生物 DNA 条 形 码 数据 平台 相继 建立 ， 
提供 了 海量 的 生物 信息 学 数据 和 知识 ; (3) 分 子 
测序 已 进入 第 三 代 测 序 技术 时 代 ， 纳 米 孔 测序 法 
的 研究 进展 ， 使 得 精确 、 快 速 地 进行 DNA 测序 
成 为 可 能 ; (4) 目前 还 未 能 真正 实现 DNA 条 形 
码 的 便携 式 移 动 设备 ， 但 一 些 基 于 不 同 理念 的 初 
级 植物 物种 识别 设备 已 经 出 现 ， 相 关 技术 在 不 断 
完善 和 发 展 中 ; (5) 电子 植物 志 ， 以 及 未 来 GSPC 
和 GNA 构想 的 实施 ， 意 味 着 整合 的 、 数 字 化 的 、 
基于 网 络 的 植物 志 时 代 已 经 到 来 ;而 随 着 更 多 像 
iPlant 这 样 的 跨 领域 计划 出 现 ， 信 息 技术 与 植物 
科学 研究 的 结合 ， 不 同学 科 和 领域 之 间 的 合作 ， 
将 成 为 植物 科学 的 一 个 发 展 趋势 。 

可 以 预见 ， 随 着 未 来 植物 DNA 条 形 码 技术 
的 发 展 ， 植 物 DNA 条 形 码 标准 数据 库 的 不 断 扩 
充 和 完善 都 将 为 iFlora 的 实施 提供 丰富 的 数据 资 
源 和 技术 条 件 ; 相关 研究 对 物种 准确 快速 鉴定 ， 
植物 多 样 性 信息 的 快速 获取 和 使 用 的 需求 也 将 催 
生 和 促进 iFlora 的 出 现 和 发 展 ; 大 量 的 生物 多 样 
性 数据 平台 为 iFlora 提供 了 生物 多 样 性 和 遗传 信 
息 的 海量 数据 ， 以 及 不 同类 型 资源 整合 利用 的 机 
会 ; 由 于 纳米 孔 测 序 技术 的 出 现 ，DNA 测序 已 
进入 更 便宜 、 更 方便 快捷 的 时 代 ， 而 与 移动 设备 
相关 的 技术 不 断 进步 和 深入 探索 ， 使 下 lora 这 种 
创新 地 利用 DNA 数据 来 获取 植物 信息 的 方式 成 
为 可 能 ; 基础 数据 的 数字 化 、 整 合 化 利用 ， 以 及 
大 型 网 络 基础 设施 与 植物 科学 研究 的 结合 ， 意 味 
着 未 来 跨 资源 、 跨 学 科 、 跨 领域 的 iFlora 协同 研 
发 平台 将 成 为 植物 学 相关 研究 发 展 的 必然 趋势 。 
在 现代 植物 学 与 信息 技术 、 计 算 机 科学 不 断 融 
合 ， 生 物 多 样 性 数据 平台 间 合 作 不 断 加 深 的 过 程 
中 ， 形 成 不 同学 科 工 作者 可 以 共同 参与 、 整 合 多 
方 资源 和 数据 ， 并 可 以 在 多 个 领域 上 开展 协同 合 
作 的 开放 的 iFlora 智能 认 知 系统 。 
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